Национальный корпус русского языка — представительная коллекция текстов
на русском языке
общим объемом более 2 млрд слов,
оснащенная лингвистической разметкой и инструментами поиска
Поиск по корпусам
Новости
Показать всеПополнены коллекции устной речи в Акцентологическом и Устном корпусах. Добавлены записи бесед и интервью с жителями многих регионов России, которые стали героями сюжетов документальных фильмов из цикла «Письма из провинции» и видеоблогов, материалы фольклорных экспедиций. Пополнены коллекции монологов-воспоминаний, повседневной диалогической речи, в том числе молодежной, собранные студентами Воронежского государственного университета, МГУ им М.В. Ломоносова, Государственного университета просвещения. Общий объем пополнения составляет около 180 тыс. словоупотреблений.
Объем Устного корпуса теперь составляет 15 млн словоупотреблений, общий объем Акцентологического корпуса, вместе с наивной поэзией, — 135,9 млн словоупотреблений.
Мультимедийный корпус пополнен на 120 тыс. словоупотреблений. В него были добавлены: большая коллекция записей художественного чтения — рассказы и повести Н.В. Гоголя, А.С. Пушкина, А.И. Куприна, М.М. Зощенко, Вс.В. Иванова, Ю.П. Казакова, В.М. Шукшина в исполнении известных актеров Т.В. Дорониной, Н.Г. Гундаревой, В.М. Соломина, А.А. Калягина, И.В. Ильинского, Е.В. Князева, Б.П. Чиркова, С.Ю. Юрского; записи телевизионных интервью и ток-шоу. Пополнена коллекция записей региональной речи. В нее вошли беседы и интервью с жителями Воронежской области, Бурятии, Татарстана, Республики Коми, которые являются героями сюжетов документальных фильмов из цикла «Письма из провинции». В корпус включены также записи непубличной речи — разговоры с родственниками и друзьями в неформальной обстановке.
Древнерусский корпус достиг объема 913 тысяч слов. В него включено еще несколько литературных и деловых текстов, а также новая коллекция избранных экстратекстов — приписок к древнерусским рукописям самого разного содержания (от торжественных записей о создании и заказчике книги до бытовых заметок на полях), представляющих большой интерес для истории языка и культуры. Экстратексты включены по наиболее актуальным научным публикациям (В. Б. Крысько, М. Г. Гальченко, А. А. Гиппиуса, С. М. Михеева и других), а также, как правило, сверены по электронным копиям рукописей. Число словоформ, для которых полностью размечены греческие соответствия, достигло 237 тыс.